Search CORE

7 research outputs found

Unsupervised multiple kernel learning approaches for integrating molecular cancer patient data

Author: Speicher Nora K.
Publication venue: 'Walter de Gruyter GmbH'
Publication date: 01/01/2019
Field of study

Cancer is the second leading cause of death worldwide. A characteristic of this disease is its complexity leading to a wide variety of genetic and molecular aberrations in the tumors. This heterogeneity necessitates personalized therapies for the patients. However, currently defined cancer subtypes used in clinical practice for treatment decision-making are based on relatively few selected markers and thus provide only a coarse classifcation of tumors. The increased availability in multi-omics data measured for cancer patients now offers the possibility of defining more informed cancer subtypes. Such a more fine-grained characterization of cancer subtypes harbors the potential of substantially expanding treatment options in personalized cancer therapy. In this thesis, we identify comprehensive cancer subtypes using multidimensional data. For this purpose, we apply and extend unsupervised multiple kernel learning methods. Three challenges of unsupervised multiple kernel learning are addressed: robustness, applicability, and interpretability. First, we show that regularization of the multiple kernel graph embedding framework, which enables the implementation of dimensionality reduction techniques, can increase the stability of the resulting patient subgroups. This improvement is especially beneficial for data sets with a small number of samples. Second, we adapt the objective function of kernel principal component analysis to enable the application of multiple kernel learning in combination with this widely used dimensionality reduction technique. Third, we improve the interpretability of kernel learning procedures by performing feature clustering prior to integrating the data via multiple kernel learning. On the basis of these clusters, we derive a score indicating the impact of a feature cluster on a patient cluster, thereby facilitating further analysis of the cluster-specific biological properties. All three procedures are successfully tested on real-world cancer data. Comparing our newly derived methodologies to established methods provides evidence that our work offers novel and beneficial ways of identifying patient subgroups and gaining insights into medically relevant characteristics of cancer subtypes.Krebs ist eine der häufigsten Todesursachen weltweit. Krebs ist gekennzeichnet durch seine Komplexität, die zu vielen verschiedenen genetischen und molekularen Aberrationen im Tumor führt. Die Unterschiede zwischen Tumoren erfordern personalisierte Therapien für die einzelnen Patienten. Die Krebssubtypen, die derzeit zur Behandlungsplanung in der klinischen Praxis verwendet werden, basieren auf relativ wenigen, genetischen oder molekularen Markern und können daher nur eine grobe Unterteilung der Tumoren liefern. Die zunehmende Verfügbarkeit von Multi-Omics-Daten für Krebspatienten ermöglicht die Neudefinition von fundierteren Krebssubtypen, die wiederum zu spezifischeren Behandlungen für Krebspatienten führen könnten. In dieser Dissertation identifizieren wir neue, potentielle Krebssubtypen basierend auf Multi-Omics-Daten. Hierfür verwenden wir unüberwachtes Multiple Kernel Learning, welches in der Lage ist mehrere Datentypen miteinander zu kombinieren. Drei Herausforderungen des unüberwachten Multiple Kernel Learnings werden adressiert: Robustheit, Anwendbarkeit und Interpretierbarkeit. Zunächst zeigen wir, dass die zusätzliche Regularisierung des Multiple Kernel Learning Frameworks zur Implementierung verschiedener Dimensionsreduktionstechniken die Stabilität der identifizierten Patientengruppen erhöht. Diese Robustheit ist besonders vorteilhaft für Datensätze mit einer geringen Anzahl von Proben. Zweitens passen wir die Zielfunktion der kernbasierten Hauptkomponentenanalyse an, um eine integrative Version dieser weit verbreiteten Dimensionsreduktionstechnik zu ermöglichen. Drittens verbessern wir die Interpretierbarkeit von kernbasierten Lernprozeduren, indem wir verwendete Merkmale in homogene Gruppen unterteilen bevor wir die Daten integrieren. Mit Hilfe dieser Gruppen definieren wir eine Bewertungsfunktion, die die weitere Auswertung der biologischen Eigenschaften von Patientengruppen erleichtert. Alle drei Verfahren werden an realen Krebsdaten getestet. Den Vergleich unserer Methodik mit etablierten Methoden weist nach, dass unsere Arbeit neue und nützliche Möglichkeiten bietet, um integrative Patientengruppen zu identifizieren und Einblicke in medizinisch relevante Eigenschaften von Krebssubtypen zu erhalten

Universaar

Acronym

Towards Multiple Kernel Principal Component Analysis for Integrative Analysis of Tumor Samples

Author: Pfeifer Nico
Speicher Nora K.
Publication venue: 'Walter de Gruyter GmbH'
Publication date: 01/01/2017
Field of study

Personalized treatment of patients based on tissue-specific cancer subtypes has strongly increased the efficacy of the chosen therapies. Even though the amount of data measured for cancer patients has increased over the last years, most cancer subtypes are still diagnosed based on individual data sources (e.g. gene expression data). We propose an unsupervised data integration method based on kernel principal component analysis. Principal component analysis is one of the most widely used techniques in data analysis. Unfortunately, the straightforward multiple kernel extension of this method leads to the use of only one of the input matrices, which does not fit the goal of gaining information from all data sources. Therefore, we present a scoring function to determine the impact of each input matrix. The approach enables visualizing the integrated data and subsequent clustering for cancer subtype identification. Due to the nature of the method, no hyperparameters have to be set. We apply the methodology to five different cancer data sets and demonstrate its advantages in terms of results and usability

arXiv.org e-Print Archive

Directory of Open Access Journals

MPG.PuRe

Integrating different data types by regularized unsupervised multiple kernel learning with application to cancer subtype discovery

Author: Nico Pfeifer
Nora K. Speicher
Publication venue: 'Oxford University Press (OUP)'
Publication date
Field of study

Crossref

web-rMKL: a web server for dimensionality reduction and sample clustering of multi-view data based on unsupervised multiple kernel learning

Author: Herr Marius
Kersten Nicolas
Pfeifer Nico
Röder Benedict
Speicher Nora K.
Publication venue: 'Oxford University Press (OUP)'
Publication date: 01/01/2019
Field of study

Publikationsserver der Universität Tübingen

MPG.PuRe

web-rMKL: a web server for dimensionality reduction and sample clustering of multi-view data based on unsupervised multiple kernel learning

Author: Benedict Röder
Daily
Goldman
Gärtner
Liu
Marius Herr
Mejía-Roa
Nico Pfeifer
Nicolas Kersten
Nora K Speicher
Rappoport
Singh
Speicher
Vert
Witten
Yan
Yen-Yu Lin
Publication venue: 'Oxford University Press (OUP)'
Publication date
Field of study

Crossref

Bi-Force: large-scale bicluster editing and its application to gene expression data biclustering

Author: Aloise
Amit
Barkow
Barrett
Baumbach
Benson
Bergmann
Busygin
Böcker
Böcker
Cheng
Cheng
Eren
Falcon
Fan
Fellows
Fruchterman
Gonçalves
Guo
Guo
Harpaz
Hochberg
Hochreiter
Jan Baumbach
Jiong Guo
King
Kluger
Lazzeroni
Li
Madeira
Mahajan
Morris
Murali
Nora K Speicher
Peng Sun
Prelić
Richard Röttger
Stacklies
Sun
Tanay
Turner
Wittkop
Wittkop
Wittkop
Publication venue: 'Oxford University Press (OUP)'
Publication date
Field of study

Crossref